FILTER MODE ACTIVE

#модели рассуждений

Найдено записей: 3

#модели рассуждений14.06.2025

OpenThoughts: Масштабируемый пайплайн для создания данных SFT в моделях рассуждений

OpenThoughts представляет масштабируемый пайплайн для создания данных SFT, значительно повышающий качество моделей рассуждений и достигающий передовых результатов в математике, программировании и науке.

#модели рассуждений05.06.2025

NVIDIA представила ProRL: длительное обучение с подкреплением улучшает рассуждения и обобщение в ИИ

NVIDIA представила ProRL — новый метод обучения с подкреплением, который за счет увеличения длительности тренировки раскрывает новые способности к рассуждению в моделях ИИ и показывает высокую эффективность на различных тестах.

#модели рассуждений27.04.2025

Оптимизация производительности рассуждений: подробный анализ методов масштабирования во время инференса в языковых моделях

Новое исследование демонстрирует, что специализированные модели рассуждений с эффективными методами масштабирования во время инференса, такими как голосование большинства, превосходят общие модели в сложных задачах, открывая пути к оптимизации ресурсов.